【项目实战】Python基于卷积神经网络CNN模型和VGG16模型进行图片识别项目实战

胖哥真不错

已于 2023-11-20 09:48:42 修改

阅读量1w

点赞数 7

分类专栏：机器学习 python 文章标签： python 卷积神经网络 CNN算法 VGG16模型 pca降维

于 2022-01-22 22:18:59 首次发布

本文链接：https://blog.csdn.net/weixin_42163563/article/details/122635928

版权

python 同时被 2 个专栏收录

530 篇文章 97 订阅

订阅专栏

机器学习

372 篇文章 271 订阅

订阅专栏

说明：这是一个机器学习实战项目（附带数据+代码+文档+视频讲解），如需数据+代码+文档+视频讲解可以直接到文章最后获取。

1.项目背景

深度学习（Deep Learning，DL）是机器学习研究中的一个新的领域，源自人工神经网络，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释图像、声音、文本等数据。深度学习属于无监督学习，通过组合低层特征形成更加抽象的高层特征或属性特征，以发现数据的分布式特征表示，学习更有用的特征，从而最终提高分类或预测的准确性。卷积神经网络（CNN）是深度学习框架的一种。CNN 的特征检测层通过训练数据进行学习，所以在使用时，避免了显式的特征抽取，而隐式地从训练数据中进行学习；再者由于同一特征映射面上的神经元权值相同，所以网络可以并行学习。CNN 以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性，其布局更接近于实际的生物神经网络，权值共享降低了网络的复杂性，特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。

卷积神经网络（CNN）是一个多层的神经网络，它的基本结构就是输入层、卷积层（conv）、子采样层（pool-ing）、全连接层、输出层（分类器）。

2.数据获取

本次建模数据来源于网络(本项目撰写人整理而成)，数据项统计如下：

数据详情如下(部分展示)：

上图为六种类型的图片。

上图为建筑类的图片，部分作为展示。

3.数据预处理

3.1 加载和读取数据

关键代码：

4.探索性数据分析

4.1.检查目标变量的分布

用Pandas工具进行统计，输出结果如下：

图形化展示如下：

从上图可以清晰地看到每种类型图片的数量分布。

4.2.训练集图片类别饼图

通过上图可以看到六种类型的图片占比基本一致。

4.3.随机展示图片

上图为随机展示的一张图片。

上图为随机展示的25张图片。

5.特征工程

5.1.数据标准化

关键代码如下：

把训练集和测试集图片数据进行标准化。

6.构建模型

主要使用使用CNN算法和VGG16网络，用于目标分类。

6.1建立简单的CNN模型

关键代码如下：

6.1.1.绘制准确率和损失曲线图

关键代码如下：

6.1.2.模型评估

模型损失：

随机绘图：针对预测的结果进行随机绘图。

针对分错类的图片进行绘图：随机绘制25张图片。

混淆矩阵：

关键代码：

6.2.应用VGG16模型

关键代码：

6.2.1.PCA降维

关键代码：

6.2.2.绘制准确率和损失曲线图

6.2.3.最终模型准确率

关键代码如下：

7.结论与展望

基于深度学习的研究已经成为当今机器智能领域的热门方向，越来越多的科研人员将目光锁定在深度学习的研究和应用上。而卷积神经网络（CNN）作为一种受欢迎的深度学习框架，在图像识别和图像分类方面的优势也越来越明显。

综上所述，本文采用了CNN和VGG模型，最终证明了我们提出的模型效果良好。准确率达到了89%，可用于日常生活中进行建模预测，以提高价值。

images = []
labels = []

print("Loading {}".format(dataset))


# 本次机器学习项目实战所需的资料，项目资源如下：

链接：https://pan.baidu.com/s/1IVvenC0-rAbCD8qcvqaBzw 
提取码：weha






# 循环访问与类别对应的每个文件夹
for folder in os.listdir(dataset):
    label = class_names_label[folder]

    # 循环访问我们文件夹中的每个图像
    for file in tqdm(os.listdir(os.path.join(dataset, folder))):
        # 获取图片的路径名字
        img_path = os.path.join(os.path.join(dataset, folder), file)

        # 读取图片并调整大小
        image = cv2.imread(img_path)
        image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
        image = cv2.resize(image, IMAGE_SIZE)

        # 图片和标签输出到列表
        images.append(image)
        labels.append(label)

images = np.array(images, dtype='float32')
labels = np.array(labels, dtype='int32')

output.append((images, labels))